iT邦幫忙

2023 iThome 鐵人賽

DAY 25
0
AI & Data

Diffusion 模型、物件偵測Yolo v7& Yolo v4 系列 第 25

DAY 25 YOLO家族圖譜與模型架構

  • 分享至 

  • xImage
  •  
tags: 第 16 屆 iThome 鐵人賽 (2023)

{%hackmd BJrTq20hE %}

yolov7 架構簡圖
彩色的方塊可以看作是各自的輸出特徵圖,而箭頭則是轉換這些數據的多個卷積模塊。

錯綜複雜的YOLO家族圖譜

source: DeepHub IMB
其中,v7為繼承自v4,為官方認證。(另外v7還有個非官方版,不列入討論)

歷代版本架構與數據增強演變
補充:FPN 特徵金字塔網路

YOLO v7官方連結

YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors

https://github.com/WongKinYiu/yolov7

主要特點

YOLOv7通過引入幾項架構重塑提高了速度和準確性。與Scaled YOLOv4類似,YOLOv7的骨架不使用ImageNet預訓練的骨架。相反,這些模型完全使用COCO數據集來訓練。因為YOLOv7與Scaled YOLOv4是由同一作者編寫的,因此架構相近。在YOLOv7的論文中引入了以下主要變化:

  • 擴展的高效層聚合網路 E-ELAN (Extended Efficient Layer Aggregation Network)

圖2(b)中的CSPVoVNet[79]的設計是VoVNet[39]的一個變種。除了考慮上述基本的設計問題外,CSPVoVNet[79]的結構還分析了梯度路徑( gradient path),使不同層的權重可以學習更多不同的特徵。

VoVNet設計式意圖

  • E-ELAN 模組圖

參考文件

https://hackmd.io/@YungHuiHsu/BJ7fpQyps?utm_source=preview-mode&utm_medium=rec


上一篇
DAY 24 YOLOv4 MNIST手寫數字辨識資料 -3
下一篇
DAY 26 YOLv7模型架構
系列文
Diffusion 模型、物件偵測Yolo v7& Yolo v4 30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言